asama 使用上知っておくべき最低限のことを以下に記す. 詳細を知りたい場合はasama構築ログを参照すること. <諸元> OS:debian11 ジョブスケジューラ:OpenPBS MPI:OpemMPI <留意点> ・NISサーバにより /home の情報がすべてのノードで共有されている. ユーザ追加手順はいかのとおり @管理ノード $ sudo adduesr “username” $ sudo make -C /var/yp (←NISサーバを更新するコマンド) ・NFSでasamaネットワークに公開されている(管理ノードと計算ノードで共有されてい る)ディレクトリは以下の通り /opt /work00 ・DCPAM 構築のために必要なソフトが格納されているディレクトリは /work00/lib-mpi ・MPIコンパイラ(mpif90,mpicc等)が格納されているディレクトリは /work00/openmpi1/bin ・計算は /work00 に自分の名前のディレクトリを作成して行うこと(nozomiと同じ) 作成するのは管理者に依頼するか管理者がユーザ追加と同時に行う <抱えている問題> ・データ分割する際,作業を行っているノードのCPU物理コア数以上に分割できない(管理 ノードなら3以上,計算ノードなら12以上) ・ノード指定してもその通りにやってくれていない可能性がある(nozomiも同) ・OpenPBSを動かすのにコツがいる. /etc/hosts 内のノード記述の順番を変えるとOpenPBSが動かなくなる. 今の状態が以下(管理ノード) 127.0.0.1 localhost #127.0.0.1 asama 192.168.110.1 asama 192.168.110.101 asama101.ep.sci.hokudai.ac.jp asama101 192.168.110.102 asama102.ep.sci.hokudai.ac.jp asama102 133.87.45.14 asama.ep.sci.hokudai.ac.jp asama ジョブ管理はこの設定でうまくやってくれるが,PBSの各種設定はこれだと権限がない といわれてできない,と同時にPBSサーバの停止(再起動)もできない. ということで,設定及び停止,再起動をする場合は2行目のコメントアウトを外す(#を消す).尚,その状態でジョブを投入するといつまでも待機状態になって走らないため、こと が終わったらまたコメントアウトをつける./etc/hosts ファイルの変更は即時適用されるようなので再起動等は不要. 自分はこの問題の解決を諦めてしまったが,誰か解決できる人がいればぜひ直してほし い.